5.外部DB最終データ取込と公報番号の調整
上記4.で書出した登録・公開番号に基づいて、外部DBからデータを取込む。
登録番号によるデータは、(無審査実案などを除き)公開番号によるデータと重複するが、どちらを基にするかで得られるデータ内容が異なる。(請求項の内容など・・・)
共願者の分離
ここからは、取込んだCSVデータの料理の仕方です。
一言で言うと、目的のデータ部分をテキスト関数を使って抽出し、対応するフィールドに振り分けていくということです。
(CSVデータは、一旦FileMakerの別テーブルに取込んでおき、このデータを使います。)
権利者・出願人は、複数のデータをコンマで区切って1つのデータとして提供されます。
単純に最初のコンマまでを権利者1としても良いし、データの中に特定の名前があった場合はそれを権利者1としても良い。
権利状況のアップデート
外部DBからのCSVデータには、現在までの中間履歴が含まれています。
出願人や特許庁のアクションと日付が、コンマで区切られて隣接しています。
この中から最新のアクションと日付を抽出し、フィールドに記録します。
機械的に最新のアクションを抽出するのではなく、その時の権利状況を表すアクションを抽出します。
独立項の段落分け
外部DBからのCSVデータでは、「【請求項1】・・・・・【請求項2】・・・・・」全ての請求項が羅列された形で提供されます。ここから独立項のみ抽出します。従属項を見たいときは、PDF公報へのリンクボタンがあるので、そちらで確認すればよいでしょう。
まず、「【請求項 」が2番目に出てきた文字位置を見つけ、その直前までが【請求項1】なので抽出し、「独立項1フィールドに記録します。
外部DBから取込んだ請求項データから、上記独立項1のデータ部分を消します。
以下、「【請求項 」が2番目に出てきた文字位置を見つけて抽出し、その中に「請求項」など特定のKWが2つ以上含まれていれば従属項、1つしかなければ独立項。また、その1つが「【請求項 」ならほぼ確実でしょう。これで、独立項として抽出するかどうかを判断します。
但し、外国の国際出願で日本に移行してきたものなどには、「請求項」という記載をせず、単に1.とか2.と書かれているものもあるので、請求項に「請求項」という記載パターンが無いことが多い場合は、記載パターンを分析し、「【請求項 」に書換えてから処理するなど対応が必要かも知れません。
既存データ更新
既存のテーブルと更新用テーブルは公開番号でリレーションされています。
単純に、公開番号が一致するもののデータを比較し、更新用テーブルのデータが新しければ、その部分について既存テーブルを書換えます。
更新用テーブルのデータは常に既存テーブルのものと同じかそれより新しいので、一括で入換えてしまえばよいようにも思いますが、その時どこが更新されたかを確認し、権利上影響のある部分の場合は、後で一括で検索できるようその出願にチェックを入れます。
また、登録番号が付いたものはその番号を書出すようになっており、PDF公報を入手して特定のフォルダに保存しておけば、該当レコードに登録番号を記載してPDF公報を公報フォルダにコピーします。
更新用テーブルで、更新し終わったレコードを都度順々に削除していけば、後には対応する既存データの無いレコードが残ります。